Národní úložiště šedé literatury Nalezeno 6 záznamů.  Hledání trvalo 0.00 vteřin. 
Modul shlukové analýzy systému pro dolování z dat
Riedl, Pavel ; Burgetová, Ivana (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Tato diplomová práce se zabývá vývojem modulu pro systém dolování z dat, jenž je vyvíjen na FIT. První část se věnuje obecnému procesu získávání znalostí a shlukové analýze včetně validace shluků, popisuje také Oracle Data Mining včetně algoritmů, které používá pro shlukování. Na závěr představuje vyvíjený systém a jím používané technologie, kterými jsou platforma NetBeans a jazyk DMSL. Druhá část popisuje návrh modulu shlukové analýzy a modulu pro porovnání jejích výsledků. Věnuje se také vizualizaci výsledku shlukové analýzy a ukazuje dosažené cíle.
Shlukování dat pomocí procedury MCluster-Miner systému LISp-Miner
Pelc, Tomáš ; Šimůnek, Milan (vedoucí práce) ; Šulc, Zdeněk (oponent)
Bakalářská práce se zabývá shlukováním dat pomocí procedury MCluster-Miner systému LISp-Miner. Prvním cílem práce je shluková analýza dat pomocí zmíněné procedury a posouzení možností jejího využití na různých datových sadách. Pro dosažení tohoto cíle práce je prakticky aplikována daná procedura na šesti datových sadách. Druhým cílem práce je rozebrat možnosti implementovaných algoritmů, měr podobnosti a navrhnout doporučení pro volbu parametrů úlohy shlukování. K splnění tohoto cíle jsou dostupné algoritmy a míry podobnosti porovnány podle dosažených výsledků (kvalita rozdělení objektů do shluků, čas úlohy, počet atributů použi-tých pro shlukování). Následně jsou z těchto porovnání odvozena doporučení pro volbu parame-trů úlohy shlukování. Přínosem práce jsou tyto doporučení, porovnání dostupných algoritmů a měr podobnosti, shrnutí aktuálního stavu (ke květnu 2017) modulu MCluster-Miner a ukázání možnosti zobrazení výsledků shlukovací úlohy na interaktivní analýze geografických dat. V teo-retické části práce je popsán systém LISp-Miner, základní principy shlukování, způsoby shluková-ní a míry podobnosti, které využívá GUHA-procedura MCluster-Miner, a modul MCluster-Miner. V praktické části je aplikována procedura MCluster-Miner na šesti různých datových sadách a jsou zde shrnuty dosažené výsledky.
Míry podobnosti pro nominální data v hierarchickém shlukování
Šulc, Zdeněk ; Řezanková, Hana (vedoucí práce) ; Šimůnek, Milan (oponent) ; Žambochová, Marta (oponent)
Tato disertační práce se zabývá mírami podobnosti pro nominální data v hierarchickém shlukování, které umožňují zacházet s proměnnými s více než dvěma kategoriemi a které si kladou za cíl nahradit postupy založené na koeficientu prosté shody, které se v této oblasti běžně používají. Tyto míry podobnosti uvažují dodatečné informace ohledně datového souboru, jako je rozdělení četností kategorií u dané proměnné nebo počet jejích kategorií. Tato práce se věnuje třem hlavním cílům. Prvním cílem je prozkoumání a ohodnocení kvality shlukování vybraných měr podobnosti pro hierarchické shlukování objektů a proměnných. K dosažení tohoto cíle bylo provedeno několik experimentů, které se zabývají jak shlukováním objektů, tak proměnných. Tyto experimenty zkoumají kvalitu shluků vytvořených za pomocí zkoumaných měr podobnosti pro nominální data ve srovnání běžně používanými mírami podobnostmi využívajícími binární transformaci a dále s několika alternativními metodami pro shlukování nominálních dat. Toto porovnání je provedeno na reálných i generovaných souborech. Výstupy těchto experimentů vedou ke zjištění, které míry podobnosti jsou vhodné k obecnému použití, které podávají dobré výsledky v konktrétních situacích a které nejsou doporučeny pro shlukování objektů nebo proměnných. Druhým cílem práce je navržení míry podobnosti vycházející z teoretických předpokladů a její následné porovnání s ostatními zkoumanými mírami podobnosti. Na základě tohoto cíle byly představeny dvě nové míry podobnosti, Variable Entropy a Variable Mutability. Obzvláště prvně zmíněná míra podává velmi dobré výsledky u souborů s nižším počtem proměnných. Třetím cílem této práce je poskytnout komfortní sofwarové řešení založené na zkoumaných mírách podobnosti pro nominální data, které pokrývá celý proces shlukování od výpočtu matice vzdálenosti po hodnocení výsledných shluků. Tento cíl byl dosažen vytvořením balíčku nomclust pro program R, který řeší tuto problematiku a který je volně dostupný.
Modul shlukové analýzy systému pro dolování z dat
Riedl, Pavel ; Burgetová, Ivana (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Tato diplomová práce se zabývá vývojem modulu pro systém dolování z dat, jenž je vyvíjen na FIT. První část se věnuje obecnému procesu získávání znalostí a shlukové analýze včetně validace shluků, popisuje také Oracle Data Mining včetně algoritmů, které používá pro shlukování. Na závěr představuje vyvíjený systém a jím používané technologie, kterými jsou platforma NetBeans a jazyk DMSL. Druhá část popisuje návrh modulu shlukové analýzy a modulu pro porovnání jejích výsledků. Věnuje se také vizualizaci výsledku shlukové analýzy a ukazuje dosažené cíle.
Klasické a současné postupy ve shlukové analýze
Řezanková, Hana
Článek se zaměřuje na vývoj vybraných postupů ve shlukové analýze. Jde o nedávno navržené míry podobnosti pro objekty charakterizované nominálními proměnnými, vývoj algoritmů pro k-shlukování a vývoj metod pro shlukování v případě velkých datových souborů a kategoriálních dat. U algoritmů pro k-shlukování je pozornost věnována zohlednění neurčitosti při zařazování objektů do shluků, konkrétně algoritmům FCM (fuzzy k-průměrů), PCM, FPCM, RCM, RFCM a RFPCM. Pro velké datové soubory jsou zařazeny algoritmy CURE, ROCK, CLARA, CLARANS a BIRCH, pro shlukování kategoriálních dat pak algoritmy COOLCAT a ROCK. Zmíněna je též dvoukroková shluková analýza pro shlukování velkých datových souborů s proměnnými různých typů.
Hodnocení výsledků metod shlukové analýzy
Löster, Tomáš ; Řezanková, Hana (vedoucí práce) ; Berka, Petr (oponent) ; Dohnal, Gejza (oponent)
Shluková analýza zahrnuje řadu metod a postupů, které slouží především ke klasifikaci objektů. Zastává významnou roli v mnoha odvětvích. Vzhledem k tomu, že se výsledná rozdělení objektů do shluků mohou lišit v závislosti na zvolených metodách a dílčích specifikacích, je vhodné získané výsledky hodnotit. Jedním z cílů této disertační práce bylo vytvořit strukturovaný přehled existujících koeficientů a postupů určených pro hodnocení výsledků shlukování, a to jednak v závislosti na použitých metodách, jednak v závislosti na počtu shluků. Hlavním cílem pak bylo navržení nových, resp. modifikace existujících koeficientů pro hodnocení těchto výsledků v situaci, kdy jsou objekty charakterizované kvalitativními proměnnými, resp. proměnnými různých typů. Nově navržené koeficienty jsou založeny na zjišťování variability, která je současně využívána i pro stanovení odlišnosti objektů i shluků. Variabilita v případě nominálních proměnných je zjišťována buď na základě variačního poměru, nebo pomocí entropie, či Giniho koeficientu, v případě ordinálních proměnných pak na základě koeficientu dorvar; v případě kombinace s kvantitativními proměnnými jde o kombinaci s využitím rozptylu. Vhodnost použití vybraných koeficientů je zkoumána na reálných datech, u kterých je buď známé, nebo neznámé zařazení objektů do shluků. Analyzované datové soubory jsou různého rozsahu, obsahují různé typy a počty proměnných. V daných situacích je zjišťována možnost aplikace vybraných koeficientů pro stanovení optimálního počtu shluků. Cíle práce je tedy možné považovat za splněné. Přínosem této disertační práce je navržení nových způsobů měření podobnosti objektů a shluků v případech, jsou-li objekty charakterizovány jinými než pouze kvantitativními proměnnými. Dalším přínosem je klasifikace existujících hodnotících koeficientů. Stěžejním přínosem je navržení nových koeficientů pro případ kvalitativních proměnných, resp. proměnných různých typů. Na základě provedených analýz byl identifikován koeficient, pomocí něhož bylo možné správně určit optimální počet shluků (na rozdíl od dosud používaného koeficientu).

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.